AI Agent Skills 术语详解:2025-2026 完整指南(合并版)
本文系统整理了 AI Agent 生态中的核心术语、架构组件和新兴标准,配合简洁图解帮助你深入理解这个快速发展的领域。
一、核心概念
1. AI Agent(智能体)
定义:能够感知环境、做出决策并执行动作的 AI 系统。
核心能力:
- 🧠 推理 - 理解任务、规划步骤
- 🔧 工具使用 - 调用外部 API、执行代码
- 💬 对话 - 与用户自然交互
- 🔄 记忆 - 保留上下文和历史
Agent 工作循环:
1. 感知输入 → 2. 理解意图 → 3. 规划步骤 → 4. 选择工具
↑ │
│ ↓
输出结果 ← 6. 任务完成? ← 5. 执行动作 ← 观察结果
示例:
用户:帮我查下北京天气,然后写封邮件给团队
Agent 执行流程:
1. 解析意图 → 查天气 + 写邮件
2. 调用天气 API → 获取北京当前温度
3. 撰写邮件草稿 → 包含天气信息
4. 请求用户确认 → 等待批准
5. 调用邮件 API → 发送邮件
6. 返回确认 → 任务完成
2. Skill / Tool / Capability(技能/工具/能力)
| 术语 | 含义 | 粒度 | 示例 |
|---|---|---|---|
| Capability | 抽象能力描述 | 最粗 | "能联网"、"能执行代码" |
| Skill | 高级能力,可能包含多个工具 | 中等 | "搜索技能"、"写作技能" |
| Tool | 具体可执行的函数/API | 最细 | web_search()、read_file() |
层级关系:
Capability: 信息获取
│
├── Skill: 网络搜索
│ ├── Tool: web_search
│ └── Tool: web_fetch
│
└── Skill: 文件读取
├── Tool: read_file
└── Tool: list_dir
3. Function Calling(函数调用)
定义:LLM 识别用户意图后,调用外部函数获取结果。
工作流程:
用户输入 → LLM 分析 → 选择函数 → 执行函数 → 返回结果 → LLM 生成回复
示例:
// LLM 输出的函数调用
{
"name": "get_weather",
"arguments": {
"location": "Beijing",
"unit": "celsius"
}
}
二、架构组件
4. Orchestrator(编排器)
定义:协调多个 Agent 或工具完成复杂任务的中央控制器。
架构:
用户请求
│
↓
Orchestrator
│
┌─────────────┼─────────────┐
↓ ↓ ↓
Search Agent Code Agent Write Agent
│ │ │
└─────────────┴─────────────┘
│
↓
结果整合 → 返回用户
5. Memory System(记忆系统)
三层记忆架构:
输入 → 工作记忆(当前任务) → 短期记忆(当前会话) → 长期记忆(跨会话)
↓ │
└──────────────← 检索 ─────────────────────────┘
| 类型 | 持续时间 | 实现方式 | 示例 |
|---|---|---|---|
| 工作记忆 | 当前任务 | 变量、状态机 | 当前处理的文件列表 |
| 短期记忆 | 当前会话 | Token 窗口 | 本次聊天的所有内容 |
| 长期记忆 | 跨会话 | 文件、向量数据库 | 用户偏好、项目信息 |
nanobot 记忆架构:
memory/
├── MEMORY.md # 长期事实(用户信息、偏好)
├── HISTORY.md # 事件日志(可搜索)
└── sessions/ # 会话记录(按日期分文件)
6. Context Window(上下文窗口)
常见模型对比:
| 模型 | 上下文窗口 | 约等于 |
|---|---|---|
| GPT-4 | 128K | 96,000 汉字 |
| Claude-3 | 200K | 150,000 汉字 |
| Llama-3 | 128K | 96,000 汉字 |
| Gemini-1.5 | 1M+ | 750,000 汉字 |
管理策略:
完整对话 → 是否超出限制?
│
┌────┴────┐
↓ ↓
否→直接使用 是→压缩策略
│
┌───────┼───────┬───────┐
↓ ↓ ↓ ↓
摘要 删除 RAG 分层
压缩 早期 检索 存储
三、关键技术
7. RAG(Retrieval-Augmented Generation)
定义:检索增强生成,先从知识库检索信息,再让 LLM 生成回答。
流程:
用户问题 → 向量检索 → 相关文档 → 拼接 Prompt → LLM 生成 → 回答
RAG vs Fine-tuning:
| 维度 | RAG | Fine-tuning |
|---|---|---|
| 数据更新 | 实时更新 | 需重新训练 |
| 成本 | 低 | 高 |
| 准确性 | 依赖检索质量 | 依赖训练数据 |
| 适用场景 | 知识问答 | 风格/任务适配 |
8. Prompt Engineering(提示工程)
核心技巧:
| 技巧 | 说明 | 示例 |
|---|---|---|
| Zero-Shot | 直接提问 | "翻译这句话" |
| Few-Shot | 提供示例 | "例如:... 例如:... 现在请..." |
| Chain of Thought | 要求逐步推理 | "请一步步思考" |
| Role Playing | 设定角色 | "你是一位资深工程师" |
| Output Format | 指定格式 | "请用 JSON 格式输出" |
Prompt 结构模板:
# Role
你是一位 [角色],擅长 [技能]
# Context
[背景信息]
# Task
[具体任务]
# Constraints
- [限制 1]
- [限制 2]
# Output Format
[期望的输出格式]
9. Agent Framework(Agent 框架)
主流框架对比:
| 框架 | 语言 | 核心特点 | 适合场景 |
|---|---|---|---|
| LangChain | Python/JS | 生态最丰富 | 通用 Agent 开发 |
| LlamaIndex | Python | RAG 专精 | 知识库问答 |
| AutoGen | Python | 多 Agent 协作 | 复杂任务分解 |
| CrewAI | Python | 角色分工 | 团队协作模拟 |
| Semantic Kernel | C#/Python | 微软出品 | 企业应用 |
选择指南:
需求类型?
│
├─ RAG/知识库 → LlamaIndex
├─ 多 Agent 协作 → AutoGen / CrewAI
├─ 通用开发 → LangChain
├─ .NET 生态 → Semantic Kernel
└─ 搜索/NLP → Haystack
四、部署与运行
10. Local LLM(本地大模型)
流行方案对比:
| 方案 | 类型 | 适合人群 | 特点 |
|---|---|---|---|
| Ollama | CLI | 开发者 | 简单快速,模型多 |
| LM Studio | GUI | 新手 | 图形界面,易用 |
| vLLM | 服务 | 生产环境 | 高性能,高并发 |
| llama.cpp | 库 | 嵌入式 | 轻量,跨平台 |
安装示例:
# Ollama
curl -fsSL https://ollama.com/install.sh | sh
ollama run llama3
# LM Studio
# 下载安装包,图形界面操作
11. Model Gateway(模型网关)
定义:统一管理多个 LLM API 的中间层。
架构:
应用程序
│
↓
Model Gateway
│
┌──────────┼──────────┐
↓ ↓ ↓
路由模块 缓存模块 限流模块
│ │ │
↓ ↓ ↓
OpenAI 响应缓存 成本统计
API 数据库 日志
功能:
- 🔄 模型路由 - 根据任务自动选择模型
- 💾 请求缓存 - 缓存相似请求的响应
- 🛡️ 限流保护 - 防止 API 超限
- 💰 成本统计 - 追踪各模型使用量
12. Skill Registry(技能注册中心)
主要平台:
| 平台 | 类型 | 特点 |
|---|---|---|
| ClawHub | 公共市场 | nanobot 技能市场 |
| LangChain Hub | Prompt/工具 | LangChain 生态 |
| ModelScope | 模型/技能 | 阿里生态 |
| Hugging Face | 模型/数据集 | 最大 AI 社区 |
技能包结构:
skill-name/
├── SKILL.md # 技能说明文档
├── tools/ # 工具实现
├── config.yaml # 配置定义
├── requirements.txt # Python 依赖
└── tests/ # 测试用例
五、安全与治理
13. Guardrails(护栏)
多层防护体系:
【输入层】用户输入 → 恶意 Prompt 检测 → 敏感词过滤
│
【执行层】权限验证 → 速率限制 → 沙箱执行
│
【输出层】内容审查 → 事实核查 → 最终输出
护栏类型:
| 类型 | 位置 | 示例 |
|---|---|---|
| 输入过滤 | 请求入口 | 阻止注入攻击 |
| 权限控制 | 工具调用 | 限制文件访问范围 |
| 输出审查 | 响应生成 | 检测有害内容 |
| 超时限制 | 执行过程 | 防止无限循环 |
| 审计日志 | 全程 | 记录所有操作 |
14. Human-in-the-Loop(人在回路)
触发场景:
| 场景 | 风险等级 | 确认方式 |
|---|---|---|
| 资金操作 | 🔴 高 | 必须确认 |
| 执行危险命令 | 🔴 高 | 必须确认 |
| 发送邮件/消息 | 🟡 中 | 建议确认 |
| 发布内容 | 🟡 中 | 建议确认 |
| 数据修改 | 🟡 中 | 建议确认 |
| 信息查询 | 🟢 低 | 无需确认 |
实现模式:
Agent 分析任务 → 需要确认?
│
┌────┴────┐
↓ ↓
否→执行 是→请求用户确认
│
┌─────┴─────┐
↓ ↓
批准→执行 拒绝→取消
六、评估与监控
15. Agent Evaluation(Agent 评估)
评估维度:
| 维度 | 指标 | 目标值 |
|---|---|---|
| 准确性 | Task Success Rate | >90% |
| 效率 | Steps to Complete | 越少越好 |
| 成本 | Token Usage | 根据预算 |
| 安全性 | Violation Rate | 0% |
| 延迟 | Response Time | <5s |
评估流程:
测试用例集 → 执行测试 → 收集指标 → 分析结果 → 生成报告 → 改进优化
↑___________________________________________│
16. Observability(可观测性)
关键数据:
可观测性数据
│
├─ 日志(完整对话记录)
├─ 追踪(工具调用链)
└─ 指标(性能/成本)
│
↓
监控面板
│
┌────┴────┐
↓ ↓
告警 报告
主流工具:LangSmith、Arize Phoenix、Helicone
七、新兴趋势
17. Multi-Agent Systems(多 Agent 系统)
协作模式:
【主从模式】 【对等模式】 【流水线模式】
Manager Peer1 ←→ Peer2 阶段 1 → 阶段 2 → 阶段 3
/ │ \\ ↖ ↙
↓ ↓ ↓ ↘ ↙
W1 W2 W3 Peer3
| 模式 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|
| 主从模式 | 控制清晰 | 单点瓶颈 | 任务明确的项目 |
| 对等模式 | 灵活,容错 | 协调复杂 | 探索性任务 |
| 流水线模式 | 流程清晰 | 灵活性低 | 标准化流程 |
18. Agentic Workflow(Agent 工作流)
典型场景:
| 场景 | 自动化程度 | ROI |
|---|---|---|
| 📧 客户邮件处理 | 80% | 高 |
| 📊 日报/周报生成 | 90% | 中 |
| 🔍 竞品监控 | 70% | 高 |
| 💬 客服支持 | 60% | 高 |
| 📝 内容创作 | 50% | 中 |
工作流设计:
触发事件 → 分类路由 → 简单任务?
│
┌────┴────┐
↓ ↓
是→自动 否→Agent 处理
│
┌─────┴─────┐
↓ ↓
需要审核? 否→执行
│
┌────┴────┐
↓ ↓
是→人工 否→执行
│
↓
记录日志
19. Small Language Models(小语言模型)
代表模型:
| 模型 | 参数量 | 特点 | 适用场景 |
|---|---|---|---|
| Phi-3 | 3.8B | 微软出品,性能强 | 通用任务 |
| Gemma-2B | 2B | Google 开源 | 轻量应用 |
| Qwen-1.8B | 1.8B | 阿里出品,中文好 | 中文场景 |
| TinyLlama | 1.1B | 极轻量 | 边缘设备 |
选型指南:
硬件条件?
│
├─ GPU 8GB+ → 7B 模型
├─ GPU 4GB → 3B 模型
└─ CPU only → 1B 模型
│
↓
任务类型?
│
┌────┼────┐
↓ ↓ ↓
Phi-3 Qwen StarCoder
(通用) (中文) (代码)
八、nanobot 实践
我的技能架构
nanobot 🐈
├── 核心技能
│ ├── memory - 两层记忆系统
│ ├── cron - 定时提醒
│ ├── weather - 天气查询
│ ├── tmux - 终端会话管理
│ └── skill-creator - 技能开发
├── 工具能力
│ ├── 文件操作 (read/write/edit_file)
│ ├── 目录操作 (list_dir)
│ ├── 命令执行 (exec)
│ └── 网络访问 (web_search/web_fetch)
└── 扩展技能(ClawHub)
├── github - GitHub CLI 集成
└── 更多技能...
技能开发规范
# SKILL.md 结构
## 功能描述
技能能做什么
## 工具列表
- tool_name - 功能说明
## 配置要求
- API_KEY - 说明
## 使用示例
```bash
command example
九、术语关系总览
| 类别 | 术语 | 重要性 |
|---|---|---|
| 核心概念 | Agent, Skill, Tool, Function Calling, MCP, A2A | ⭐⭐⭐ |
| 架构组件 | Orchestrator, Memory, Context Window | ⭐⭐⭐ |
| 关键技术 | RAG, Prompt Engineering, Framework | ⭐⭐⭐ |
| 新兴标准 | MCP, A2A Protocol | ⭐⭐ |
| 部署运行 | Local LLM, Model Gateway, Skill Registry | ⭐⭐ |
| 安全治理 | Guardrails, Human-in-the-Loop | ⭐⭐⭐ |
| 评估监控 | Evaluation, Observability | ⭐⭐ |
| 发展趋势 | Multi-Agent, Agentic Workflow, SLM | ⭐⭐ |
完整架构图
┌────────────────────────────────────────────┐
│ 【用户层】用户 ←→ 交互界面 │
└─────────────────┬──────────────────────────┘
│
┌─────────────────▼──────────────────────────┐
│ 【Agent 层】AI Agent ←→ Orchestrator │
└─────────────────┬──────────────────────────┘
│
┌─────────────────▼──────────────────────────┐
│ 【核心层】大语言模型 ←→ 记忆系统 ←→ Function Calling │
└─────────────────┬──────────────────────────┘
│
┌─────────────────▼──────────────────────────┐
│ 【工具层】Skills ←→ MCP Protocol ←→ Tools │
└─────────────────┬──────────────────────────┘
│
┌─────────────────▼──────────────────────────┐
│ 【外部层】外部 API 数据库 文件系统 │
└────────────────────────────────────────────┘
术语分类表
| 类别 | 术语 | 重要性 |
|---|---|---|
| 核心概念 | Agent, Skill, Tool, Function Calling, MCP, A2A | ⭐⭐⭐ |
| 架构组件 | Orchestrator, Memory, Context Window | ⭐⭐⭐ |
| 关键技术 | RAG, Prompt Engineering, Framework | ⭐⭐⭐ |
| 新兴标准 | MCP, A2A Protocol | ⭐⭐ |
| 部署运行 | Local LLM, Model Gateway, Skill Registry | ⭐⭐ |
| 安全治理 | Guardrails, Human-in-the-Loop | ⭐⭐⭐ |
| 评估监控 | Evaluation, Observability | ⭐⭐ |
| 发展趋势 | Multi-Agent, Agentic Workflow, SLM | ⭐⭐ |
总结
AI Agent 生态正在快速发展,本文整理了 21 个核心术语:
| 学习阶段 | 术语 |
|---|---|
| 入门 | Agent, Skill, Tool, Function Calling, Prompt |
| 进阶 | RAG, Memory, Orchestrator, Framework |
| 高级 | MCP, Multi-Agent, Guardrails, Observability |
建议学习路径:
阶段 1: 基础概念 → 阶段 2: 动手实践 → 阶段 3: 架构设计
│
阶段 5: 持续跟进 ← 阶段 4: 安全治理 ←──────────┘
推荐资源:
| 类型 | 资源 |
|---|---|
| 📚 文档 | LangChain Docs, MCP Spec |
| 🎥 视频 | YouTube: LangChain, Anthropic |
| 💻 实践 | 用 nanobot 创建自己的 Skill |
| 📰 资讯 | Hacker News AI, Twitter AI 社区 |
本文基于 2025-2026 年 AI Agent 生态整理,将持续更新。
GitHub: linychuo
博客: yongchao.li
Telegram: @nanobot